AI资讯新闻榜单内容搜索- GPT-4o

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: GPT-4o

ICLR 2026｜原生多模态推理新范式ThinkMorph ，让文字与图像在统一架构中共同演化

ICLR 2026｜原生多模态推理新范式ThinkMorph ，让文字与图像在统一架构中共同演化

ICLR 2026｜原生多模态推理新范式ThinkMorph ，让文字与图像在统一架构中共同演化

NUS、ZJU、UW、Stanford、CUHK 联合提出「ThinkMorph」，主张让文字与图像在统一架构里「原生协作」、「共同演化」，而不是像当下大多数多模态模型那样，看完图像就闭上眼睛，后续完全靠文字链条推进。仅用 2.4 万条数据微调 7B 统一模型，视觉推理平均提升 34.74%，多项任务比肩甚至超越 GPT-4o 和 Gemini 2.5 Flash。

来自主题: AI技术研报

8195 点击 2026-03-11 09:22

3.5亿参数模型媲美ChatGPT-4o？Liquid AI发布的日英翻译模型给出答案

3.5亿参数模型媲美ChatGPT-4o？Liquid AI发布的日英翻译模型给出答案

3.5亿参数模型媲美ChatGPT-4o？Liquid AI发布的日英翻译模型给出答案

在大模型的竞赛中，参数规模往往被视为性能的决定性因素。但近期，Liquid AI 的研究团队提出了一个不同寻常的案例：一个仅有 3.5 亿参数的模型，经过微调后，竟能在中短上下文的实时日语英语翻译任务上，与 GPT-4o 竞争。

来自主题: AI资讯

8011 点击 2025-09-09 12:19

性能逼近闭源最强，通义实验室开源Mobile-Agent-v3刷新10项GUI基准SOTA

性能逼近闭源最强，通义实验室开源Mobile-Agent-v3刷新10项GUI基准SOTA

性能逼近闭源最强，通义实验室开源Mobile-Agent-v3刷新10项GUI基准SOTA

覆盖桌面、移动和 Web，7B 模型超越同类开源选手，32B 模型挑战 GPT-4o 与 Claude 3.7，通义实验室全新 Mobile-Agent-v3 现已开源。

来自主题: AI技术研报

9328 点击 2025-09-03 10:47

谷歌又赢了，nano banana「被迫」改名后，网友搞出7种神仙玩法

谷歌又赢了，nano banana「被迫」改名后，网友搞出7种神仙玩法

谷歌又赢了，nano banana「被迫」改名后，网友搞出7种神仙玩法

谷歌这次又赢麻了！神秘图像编辑模型 nano banana 被谷歌认领、正式改名为 Gemini-2.5-flash-image 后，热度仍居高不下，火爆程度丝毫不亚于 GPT-4o 掀起的「吉卜力热潮」。

来自主题: AI资讯

9298 点击 2025-08-29 13:45

ICML 2025 Oral！北大和腾讯优图破解AI生成图像检测泛化难题：正交子空间分解

ICML 2025 Oral！北大和腾讯优图破解AI生成图像检测泛化难题：正交子空间分解

ICML 2025 Oral！北大和腾讯优图破解AI生成图像检测泛化难题：正交子空间分解

随着 OpenAI 推出 GPT-4o 的图像生成功能，AI 生图能力被拉上了一个新的高度，但你有没有想过，这光鲜亮丽的背后也隐藏着严峻的安全挑战：如何区分生成图像和真实图像？

来自主题: AI技术研报

8104 点击 2025-07-13 11:30

开源版MetaQuery来了！OpenUni用1.1B参数媲美BLIP3-o-8B，数据代码完全开源

开源版MetaQuery来了！OpenUni用1.1B参数媲美BLIP3-o-8B，数据代码完全开源

开源版MetaQuery来了！OpenUni用1.1B参数媲美BLIP3-o-8B，数据代码完全开源

随着 GPT-4o 展现出令人印象深刻的多模态能力，将视觉理解和图像生成统一到单一模型中已成为 AI 领域的研究趋势（如MetaQuery 和 BLIP3-o ）。

来自主题: AI技术研报

8647 点击 2025-06-22 16:39

自回归+扩散！Salesforce开源统一多模态模型BLIP3-o，图像理解与生成全拿下

自回归+扩散！Salesforce开源统一多模态模型BLIP3-o，图像理解与生成全拿下

自回归+扩散！Salesforce开源统一多模态模型BLIP3-o，图像理解与生成全拿下

OpenAI 的 GPT-4o 在图像理解、生成和编辑任务上展现了顶级性能。流行的架构猜想是：

来自主题: AI技术研报

11545 点击 2025-05-23 11:42

AI 月报丨大模型下半场与产品成败的关键；拥有更多用户可能会让模型更强；全球算力投资又凉了一些

AI 月报丨大模型下半场与产品成败的关键；拥有更多用户可能会让模型更强；全球算力投资又凉了一些

AI 月报丨大模型下半场与产品成败的关键；拥有更多用户可能会让模型更强；全球算力投资又凉了一些

2025 年 4 月的 AI 月报，你会看到：“评估（Evals）” 成为模型和 AI 产品开发的关键词；Google 继续提升 Gemini 模型能力的思路； OpenAI 的 GPT-4o 为什么变得谄媚，以及背后的问题；用户规模与模型能力提升关系不大？可能要有变化了

来自主题: AI资讯

9880 点击 2025-05-11 20:24

GPT-4o图像生成的「核燃料」找到了！万字长文拆解潜在变量，网友：原来AI在另一个维度作画

GPT-4o图像生成的「核燃料」找到了！万字长文拆解潜在变量，网友：原来AI在另一个维度作画

GPT-4o图像生成的「核燃料」找到了！万字长文拆解潜在变量，网友：原来AI在另一个维度作画

上个月， GPT-4o 的图像生成功能爆火，掀起了以吉卜力风为代表的广泛讨论，生成式 AI 的热潮再次席卷网络。

来自主题: AI技术研报

9189 点击 2025-05-06 16:59

AI界出了又会画画还能修图的大象，把Flux们都打败了

AI界出了又会画画还能修图的大象，把Flux们都打败了

AI界出了又会画画还能修图的大象，把Flux们都打败了

我又发现好东西了！前几天在 Artificial Analysis 上发现了一个新模型：17B 参数的国产模型 HiDream-I1排到第二名，和 GPT-4o 得分非常接近！

来自主题: AI资讯

11078 点击 2025-05-01 13:46

上一页当前第1页,共4页下一页